Probabilitas dan Statistika: Ilmu Ketidakpastian: Menentukan Optimalitas dalam Inferensi Statistik

Di hamparan luas data statistik, kita adalah para pemburu yang mencari kebenaran—parameter sejati $\psi(\theta)$. Tapi bagaimana kita menentukan panah (penduga) mana yang terbaik? Optimalitas bukan perasaan samar; ini adalah seni matematis dalam meminimalkan kerugian. Untuk menemukan penduga 'terbaik', kita merujuk pada Mean Squared Error (MSE), yang secara elegan terurai menjadi ketegangan antara dua kekuatan dasar: Varians dan Bias.

Menetapkan Standar Emas: MSE

Untuk mengukur seberapa jauh tebakan kita $T$ dari kenyataan $\psi(\theta)$, kita mendefinisikan Mean Squared Error (Definisi 6.3.1):

$$MSE_\theta(T) = E_\theta((T - \psi(\theta))^2)$$

Ini adalah jarak kuadrat rata-rata antara penduga kita dan target. Penduga sempurna akan memiliki MSE nol, tetapi di dunia penuh gangguan acak, kita berusaha meminimalkannya.

Teorema 8.1.1: Arsitektur Kesalahan

Mengapa suatu penduga gagal? Teorema 8.1.1 memberikan gambaran umum. Jika $T$ memiliki momen kedua yang terbatas, kesalahan relatif terhadap konstanta apa pun $c$ diberikan oleh:

$E((T - c)^2) = \text{Var}(T) + (E(T) - c)^2$

Rumus ini mengungkap bahwa kesalahan kuadrat total diminimalkan hanya ketika kita memilih $c = E(T)$. Dalam konteks inferensi, kita menetapkan $c = \psi(\theta)$, yang mengarah pada dekomposisi terkenal:

MSE = Varians + Bias$^2$

Pertukaran Antara Presisi dan Akurasi

Bayangkan dua timbangan di laboratorium kontrol kualitas:

Relik Presisi: Ia memberikan berat yang sama setiap kali (varians rendah), tetapi terkalibrasi salah sebesar 2 gram (bias tinggi).
Sang Bijak yang Tak Teratur: Ia benar secara rata-rata (bias nol), tetapi berayun liar antar pengukuran (varians tinggi).

Teorema 8.1.1 memungkinkan kita menghitung secara tepat timbangan mana yang memberikan kesalahan total lebih rendah. Seringkali, kita bersedia menerima deviasi sistematis kecil (bias) jika hal itu secara signifikan mengurangi gangguan (varians).

Contoh 8.1.1: Kepuasan dan Informasi

Optimalitas dikaitkan dengan Informasi. Pertimbangkan ruang sampel $S = \{1, 2, 3, 4\}$. Jika hasil 2, 3, dan 4 sama-sama mungkin di bawah setiap parameter yang mungkin, mereka membawa kemungkinan yang sama. Kita dapat mendefinisikan statistik yang cukup $U$ yang mengelompokkan hasil ini tanpa kehilangan kemampuan untuk membuat inferensi optimal. Seperti yang ditunjukkan simulasi, jika $L(\cdot|2) = L(\cdot|3) = L(\cdot|4)$, penduga optimal memperlakukan ini sebagai satu peristiwa informatif tunggal.

🎯 Prinsip Utama

Suatu penduga dikatakan optimal ketika meminimalkan kerugian yang diharapkan. Untuk kerugian kuadrat, ini berarti menemukan titik di mana jumlah varians dan bias² berada pada nilai minimum mutlak.

PERTANYAAN 1

Misalkan (x₁, ..., xₙ) adalah sampel dari distribusi N(μ, σ₀²), di mana μ tidak diketahui dan σ₀² diketahui. Tentukan penduga UMVU dari momen kedua μ² + σ₀².

T = x̄² + σ₀²(1 - 1/n)

T = x̄² + σ₀²

T = x̄² - σ₀²/n

T = Σxᵢ² / n

PERTANYAAN 2

Berdasarkan Teorema 8.1.1, nilai 'c' apa yang meminimalkan ekspresi E((T - c)²)?

c = ψ(θ)

$c = E(T)$

$c = Var(T)$

$c = 0$

PERTANYAAN 3

Dalam konteks Mean Squared Error, apa yang didefinisikan sebagai Bias(T)?

E(T) - ψ(θ)

$Var(T) - E(T)$

ψ(θ) / E(T)

E(T²) - [E(T)]²

PERTANYAAN 4

Dalam Contoh 8.1.1, mengapa U(s) merupakan statistik yang cukup ketika U(2)=U(3)=U(4)=1?

Karena likelihood L(θ|2), L(θ|3), dan L(θ|4) identik untuk semua θ.

Karena probabilitasnya jumlahnya 1.

Karena s=1 memiliki probabilitas tertinggi.

Karena ruang sampel berhingga.

PERTANYAAN 5

Jika suatu penduga tak bias, maka MSE-nya sama dengan:

Variansnya

Kuadrat Biasnya

Nol

Nilai parameter sejati